Integración de optimización evolutiva para el reconocimiento de emociones en voz
نویسندگان
چکیده
Resumen. En este art́ıculo se presenta el desarrollo de un sistema de reconocimiento de emociones basado en la voz. Se consideraron las siguientes emociones básicas: Enojo, Felicidad, Neutro y Tristeza. Para este propósito una base de datos de voz emocional fue creada con ocho usuarios Mexicanos con 640 frases (8 usuarios × 4 emociones × 20 frases por emoción). Los Modelos Ocultos de Markov (Hidden Markov Models, HMMs) fueron usados para construir el sistema de reconocimiento. Basado en el concepto de modelado acústico de vocales espećıficas emotivas un total de 20 fonemas de vocales (5 vocales × 4 emociones) y 22 fonemas de consonantes fueron considerados para el entrenamiento de los HMMs. Un Algoritmo Genético (Genetic Algorithm, GA) fue integrado dentro del proceso de reconocimiento para encontrar la arquitectura más adecuada para el HMM para cada vocal espećıfica emotiva. Una tasa de reconocimiento total aproximada del 90.00 % fue conseguida con el reconocedor de voz construido con los HMMs optimizados.
منابع مشابه
Factores en el reconocimiento facial de emociones y la integración de optimización evolutiva
Resumen. En este art́ıculo se presenta la integración de los Algoritmos Genéticos (Genetic Algorithms, GA) con Análisis de Componente Principal (Principal Component Analysis, PCA) y Redes Neuronales Artificiales (Artificial Neural Networks, ANNs) como un método para mejorar el reconocimiento de emociones en expresiones faciales. Para la evaluación del método dos bases de datos fueron considerada...
متن کاملAvivavoz: Tecnologías Para La Traducción De Voz
AVIVAVOZ es un proyecto de tres años dirigido a la investigación avanzada en todas las tecnologías clave que intervienen en un sistema de traducción de voz (reconocimiento, traducción y síntesis de voz). El objetivo del proyecto es lograr avances reales en todos los componentes de un sistema de traducción de voz para alcanzar sistemas de intermediación oral entre personas en las lenguas oficial...
متن کاملPHILIPS: Intelligent Speech Interpretation - la tecnología inteligente de reconocimiento de voz
Resumen: Independientemente de la aplicación, el núcleo de cualquier sistema de reconocimiento de voz sigue siendo la inteligencia que convierte el habla en texto. Al reconocer lo que se dice e interpretarlo de forma razonable, garantiza una intervención mínima en el proceso de trascripción para producir informes útiles. Palabras clave: Philips, SpeechMagic, reconocimiento del habla, tecnología...
متن کاملReconocimiento de Voz en Español Mediante Sílabas
ctualmente, el uso de los fonemas tiene implícitas varias dificultades, debido a que la identificación de las fronteras entre ellos por lo regular es difícil de encontrar en representaciones acústicas de voz. El presente trabajo plantea una alternativa a la forma en la que el reconocimiento de voz se ha estado implementando desde hace tiempo, analizando la forma en la cual el paradigma de la sí...
متن کاملMonitoreo de emociones aplicadas a terapias basadas en juegos y lógica difusa para adultos mayores
Resumen. La cantidad de personas de edad adulta en México ha aumentado gradualmente, esto ha sido posible gracias al desarrollo médico y tecnológico, lo cual en definitiva es un logro de alto impacto social. Sin embargo con este aspecto, se tiene también un aumento de personas que debido a su edad son más susceptibles a padecer algún tipo de demencia, como el Alzhéimer. Investigaciones reciente...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- Research in Computing Science
دوره 93 شماره
صفحات -
تاریخ انتشار 2015